我们为基于分数的生成模型(SGM)(例如Denoising扩散概率模型(DDPM))提供理论收敛保证,该模型构成了大型现实世界中生成模型的骨干,例如DALL $ \ cdot $ E2。我们的主要结果是,假设有准确的分数估计值,此类SGM可以从本质上有效地从任何现实的数据分布中进行采样。与先前的作品相反,我们的结果(1)以$ l^2 $准确的分数估算(而不是$ l^\ infty $ -CACCRATE)保持; (2)不需要限制性的功能不平等条件,而这些条件排除了实质性的非con虫; (3)在所有相关问题参数中刻度缩放; (4)匹配兰格文扩散离散的最新复杂性保证,前提是得分误差足够小。我们认为这是SGM的经验成功的强有力理论理由。我们还基于严重阻尼的Langevin扩散(CLD)检查SGM。与传统的观点相反,我们提供了证据,表明CLD的使用不会降低SGM的复杂性。
translated by 谷歌翻译
我们考虑了状态断层扫描的经典问题:给定未知量子状​​态$ \ rho \ in \ mathbb {c}^{d \ times d} $的副本,输出$ \ wideHat {\ rho} $ rho- \ wideHat {\ rho} \ | _ {\ Mathsf {tr}}} \ le \ varepsilon $。当一个允许在所有副本上纠缠的连贯测量值时,$ \ theta(d^2/\ varepsilon^2)$副本是必要且足够的[Haah等。 '17,O'Donnell-Wright '16]。不幸的是,达到此速率的协议会产生大量的量子内存开销,从而阻止了当前或近期设备上的实现。另一方面,使用不连贯的(单拷贝)测量的最著名协议使用$ o(d^3/\ varepsilon^2)$副本[Kueng-rauhut-terstiege '17]开放问题以了解此速度是否紧张。在这项工作中,我们通过证明任何使用不一致测量的协议(即使适应性地选择它们)需要$ \ omega(d^3/\ varepsilon^2)$副本,与[kueng的上限匹配[kueng -rauhut-terstiege '17]。我们通过一种新的证明技术来做到这一点,该技术在测量后直接界定后验分布的“倾斜”,这给出了我们下限的简短简短证明,我们认为这可能是独立的。
translated by 谷歌翻译
量子技术有可能彻底改变我们如何获取和处理实验数据以了解物理世界。一种实验设置,将来自物理系统的数据转换为稳定的量子存储器,以及使用量子计算机的数据的处理可以具有显着的优点,这些实验可以具有测量物理系统的传统实验,并且使用经典计算机处理结果。我们证明,在各种任务中,量子机器可以从指数较少的实验中学习而不是传统实验所需的实验。指数优势在预测物理系统的预测属性中,对噪声状态进行量子主成分分析,以及学习物理动态的近似模型。在一些任务中,实现指数优势所需的量子处理可能是适度的;例如,可以通过仅处理系统的两个副本来同时了解许多非信息可观察。我们表明,可以使用当今相对嘈杂的量子处理器实现大量超导QUBITS和1300个量子门的实验。我们的结果突出了量子技术如何能够实现强大的新策略来了解自然。
translated by 谷歌翻译
在这里,我们重新审视线性二次估计的经典问题,即估计线性动力系统从嘈杂测量的轨迹。当测量噪声是高斯时,庆祝的卡尔曼滤波器提供了最佳估计器,但是当一个人偏离这种假设时,广泛众所周知,众所周知会破裂。当噪音重尾时。许多临时启发式机启发式就是处理异常值的实践中。在开创性的工作中,Schick和Mitter在测量噪声是高斯的已知无穷无尽的扰动时给予了可证明的保证,并提出了一个可以获得类似的禁令的重要担保的重要问题。在这项工作中,我们给出了一个真正强大的过滤器:当甚至恒定的测量分数都存在对比腐败时,我们给出了线性二次估计的第一个强化保证。该框架可以模拟重型且甚至是非静止噪声过程。我们的算法在与知道损坏位置的最佳算法竞争的意义上强调了卡尔曼过滤器。我们的作品处于挑战性的贝叶斯环境,其中测量数量与我们需要估计的复杂性缩放。此外,在线性动态系统中过去信息随时间衰减。我们开发了一套新技术,以强大地提取不同时间步长和不同时间尺度的信息。
translated by 谷歌翻译
我们研究量子存储器的力量,以了解量子系统和动态的学习性质,这在物理和化学方面具有重要意义。许多最先进的学习算法需要访问额外的外部量子存储器。虽然这种量子存储器不需要先验,但在许多情况下,不利用量子存储器的算法需要比那些更多样的数据。我们表明,这种权衡在各种学习问题中是固有的。我们的结果包括以下内容:(1)我们显示以$ M $ -Qubit状态Rho执行暗影断层扫描,以M $观察到,任何没有量子存储器的算法需要$ \ omega(\ min(m,2 ^ n) )最坏情况下Rho的标准。达到对数因子,这与[HKP20]的上限匹配,完全解决了[AAR18,AR19]中的打开问题。 (2)我们在具有和不具有量子存储器之间的算法之间建立指数分离,用于纯度测试,区分扰扰和去极化的演变,以及在物理动态中揭示对称性。我们的分离通过允许更广泛的无量子存储器的算法来改善和概括[ACQ21]的工作。 (3)我们提供量子存储器和样本复杂性之间的第一个权衡。我们证明,估计所有$ N $ -Qubit Pauli可观察到的绝对值,Qumum Memory的$ K <N $ Qubits的算法需要至少$ \ omega(2 ^ {(nk)/ 3})$样本,但在那里是使用$ n $ -Qubit量子存储器的算法,该算法只需要$ o(n)$ samples。我们展示的分离足够大,并且可能已经是显而易见的,例如,数十Qubits。这提供了一种具体的路径,朝着使用量子存储器学习算法的实际优势。
translated by 谷歌翻译
我们证明了能够在$ N $ -Qubit州$ \ Rho $同时的最多$ k $ reporicas上进行纠结的速度,有$ \ rho $的属性,这需要至少订购$ 2 ^ n / k^ 2 $测量学习。但是,相同的属性只需要一个测量来学习,如果我们可以在$ k,n $的k,n $的多个副本多项式上进行纠缠测量。因为上面保持每个正整数$ k $,我们获得了一系列的任务等级,需要有效地执行更多的副本。我们介绍了一种强大的证明技术来建立我们的结果,并用它来提供用于测试量子状态的混合的新界限。
translated by 谷歌翻译
模型提取攻击已经再次兴趣了解来自查询的神经网络的经典问题。在这项工作中,我们给出了学习任意一个隐藏层神经网络激活的第一个多项式时间算法,提供了对网络的黑盒访问。正式,我们表明,如果$ F $是一个具有Relu激活的任意一个隐藏的层神经网络,则存在一个具有Query复杂性和运行时间的算法,这些复杂性和运行时间在所有参数中输出网络$ f'$实现低平方丢失相对达到高斯措施的$ F $。虽然安全文献中的许多作品已经提出和经验证明了某些算法的有效性,但是,即使对于最坏情况的网络,我们也是最完全多项式时间对效率保证的影响(特别是我们的算法在整个算法中取得成功)环境)。
translated by 谷歌翻译
我们重新审视量子状态认证的基本问题:给定混合状态$ \ rho \中的副本\ mathbb {c} ^ {d \ times d} $和混合状态$ \ sigma $的描述,决定是否$ \ sigma = \ rho $或$ \ | \ sigma - \ rho \ | _ {\ mathsf {tr}} \ ge \ epsilon $。当$ \ sigma $最大化时,这是混合性测试,众所周知,$ \ omega(d ^ {\ theta(1)} / \ epsilon ^ 2)$副本是必要的,所以确切的指数取决于测量类型学习者可以使[OW15,BCL20],并且在许多这些设置中,有一个匹配的上限[OW15,Bow19,BCL20]。可以避免这种$ d ^ {\ theta(1)} $依赖于某些类型的混合状态$ \ sigma $,例如。大约低等级的人?更常见地,是否存在一个简单的功能$ f:\ mathbb {c} ^ {d \ times d} \ to \ mathbb {r} _ {\ ge 0} $,其中一个人可以显示$ \ theta(f( \ sigma)/ \ epsilon ^ 2)$副本是必要的,并且足以就任何$ \ sigma $的国家认证?这种实例 - 最佳边界在经典分布测试的背景下是已知的,例如, [VV17]。在这里,我们为量子设置提供了这个性质的第一个界限,显示(达到日志因子),即使用非接受不连贯测量的状态认证的复杂性复杂性基本上是通过复制复杂性进行诸如$ \ sigma $之间的保真度的复杂性。和最大混合的状态。令人惊讶的是,我们的界限与经典问题的实例基本上不同,展示了两个设置之间的定性差异。
translated by 谷歌翻译
在这项工作中,我们研究了一个非负矩阵分解的变体,我们希望找到给定输入矩阵的对称分解成稀疏的布尔矩阵。正式说话,给定$ \ mathbf {m} \ in \ mathbb {z} ^ {m \ times m} $,我们想找到$ \ mathbf {w} \ in \ {0,1 \} ^ {m \ times $} $这样$ \ | \ mathbf {m} - \ mathbf {w} \ mathbf {w} ^ \ top \ | _0 $在所有$ \ mathbf {w} $中最小化为$ k $ -parse。这个问题结果表明与恢复线图中的超图以及私人神经网络训练的重建攻击相比密切相关。由于这个问题在最坏的情况下,我们研究了在这些重建攻击的背景下出现的自然平均水平变体:$ \ mathbf {m} = \ mathbf {w} \ mathbf {w} ^ {\ top $ \ mathbf {w} $ \ mathbf {w} $ k $ -parse行的随机布尔矩阵,目标是恢复$ \ mathbf {w} $上列排列。等效,这可以被认为是从其线图中恢复均匀随机的k $ k $。我们的主要结果是基于对$ \ MATHBF {W} $的引导高阶信息的此问题的多项式算法,然后分解适当的张量。我们分析中的关键成分,可能是独立的兴趣,是表示这种矩阵$ \ mathbf {w} $在$ m = \ widetilde {\ omega}(r)时,这一矩阵$ \ mathbf {w} $具有高概率。 $,我们使用Littlewood-Offord理论的工具和二进制Krawtchouk多项式的估算。
translated by 谷歌翻译
多种植者概率的时间序列预测对现实世界的任务(例如需求预测)具有广泛的适用性。神经时间序列的最新工作预测主要关注SEQ2SEQ架构的使用。例如,MQtransFormer(MQCNN的改进)显示了概率需求预测中最新的性能。在本文中,我们考虑通过添加跨实体注意机制以及检索机制来选择要参加哪些实体,从而通过添加跨实体注意机制来提高模型性能。我们演示了我们的新神经体系结构MQRETNN如何利用整个人群的基线模型的编码环境来提高预测准确性。使用MQCNN作为基线模型(由于计算限制,我们不使用MQtransFormer),我们首先在较小的需求预测数据集上显示,通过添加交叉实体注意机制可以提高测试损失约3%每个实体都参加人口中的所有其他实体。然后,我们通过提议的检索方法评估模型 - 作为大规模需求预测应用,用超过200万种产品的大规模需求预测应用,并观察到MQCNN基线的绩效增长约1%。
translated by 谷歌翻译